Obtener muestra de 50 registros.
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 180000 296138 486500 532539 659375 2000000
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5.00 7.00 7.00 7.48 8.00 11.00
Filtrado : df <- df %>% filter(price < 2000000)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 180000 291850 485000 502590 650000 1350000
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5.000 7.000 7.000 7.449 8.000 11.000
Usando hist() y shapiro.test()
Shapiro.test prueba que la distribución de una variable es normal estadisticamente, si p-value es mayor a 0.05. Esta prueba se utiliza para una muestra de menos de 50
shapiro.test(subdf$price)
##
## Shapiro-Wilk normality test
##
## data: subdf$price
## W = 0.90242, p-value = 0.0006599
shapiro.test(subdf$grade)
##
## Shapiro-Wilk normality test
##
## data: subdf$grade
## W = 0.86462, p-value = 4.63e-05
# prueba de correlación de variables, su valor deberia ser cercano a 1
cor.test(subdf$grade,subdf$price, method= "pearson")$estimate
## cor
## 0.7154888
En medida de que la puntuación es mas alta, los precios de las casas aumentan, se considera que la correlación es tipo positiva y moderada.